excel技能放大招:一招解决数据分析的匹配问题(一)
随着测序仪器及平台的更新换代,大数据获取的成本越来越低,途径越来越便捷,但是给我们带来的数据处理上的挑战也越来越大,尤其是大样本数据、多组学数据产生后,数据在核查及二次分析的难度也不是一般人可以驾驭的,在这里小编给您推荐一个excel升级技能,学会它(明星函数“Vlookup”),可以一次性解决您全部的数据匹配问题,相当于可以解决您三分之一的数据处理问题。
我们先来看看都能解决哪些问题,是不是您关心的问题:
1、需要的数据不在同一个excel表或同一个excel表不同sheet中,数据太多,一一拷贝太麻烦,如何整合呢?
如:基因ID、表达量数据、数据库注释信息等
2、基因数据太多,核查不同组合中的相同基因,查找起来工作量太大?
如:韦恩图可以解决组间的重合数据,但是要获得详细列表,则需要自己动 手操作了。(补充:百迈客云平台的韦恩图提供交互式基因ID信息提取,有云账号的客户有福了。没有账号也没关系,直接登录注册即可实现:https://console.biocloud.net/external/login/toLogin)。
3、不同组学中的数据整合复杂,数据量处理起来繁琐;
........................
说起excel表,是不是既熟悉又陌生呢?因为虽然你常用,但是其中的强大功能你了解吗?接下来让小编来给大家演示一下强大的“Vlookup”函数吧。
第一步:基本语法及操作
“Vlookup”:查找函数,用于在表格或数值数组的首列查找指定的数值,并由此返回表格或数组当前行中指定列处的数值,该函数的语法规则如下:
=VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
参数 简单说明 输入数据类型
lookup_value
要查找的值 数值、引用或文本字符串
table_array 要查找的区域 数据表区域
col_index_num
返回数据在查找区域的第几列数 正整数
range_lookup
模糊匹配/精确匹配 TRUE(或不填)/FALSE
具体操作请参考视频:
1:
https://v.qq.com/txp/iframe/player.html?vid=t1334m3flab&width=500&height=375&auto=0
需要注意的是,输入数字0,表示FALSE,即精确匹配,数字1表示TURE,近似匹配。
“vlookup”函数要求的比对条件必须是完全一致的,如果中间出现基因ID名称不一致的情况,则不会匹配到相应的信息,这是则需要使用“近似匹配”。
2:
https://v.qq.com/txp/iframe/player.html?vid=u1334a72pyh&width=500&height=375&auto=0
但是为了能够保证数据的完全匹配性,最稳妥的做法还是先把基因ID匹配成统一格式之后,再进行数据的检索。
基因ID如何匹配成统一格式......?
不同差异组合如何筛选共同基因......?
视频呢?视频呢?
小编很抱歉。。
因为视频数目的限制,小编只好将剩余视频内容整理放在了后台, 如果你感兴趣,请在公众号后台回复【excel】,为你推送剩余内容。。
......回复【excel】精彩继续......
这里包罗万象
学到知识、get技能
展示自我,share经验
交锋、碰撞、辩论与思考同在
只有不断学习,突破自我,才能不被时代碾压